THECHINESEBOOKFORLARGElanguageMODELS大语言模型赵鑫李军毅周昆唐天一文继荣著Copyright©RUCAIBox前言2022年底,ChatGPT震撼上线,大语言模型技术迅速“席卷”了整个社会,人工智能技术因此迎来了一次重要进展...
时间:2025-06-03 10:00栏目:综合其他
大模型原理、技术与应用从GPT到DeepSeek车万翔哈工大计算学部人工智能学院社会计算与交互机器人研究中心(HIT-SCIR)2025年2月28日为什么是语言?大模型又称大语言模型(LargelanguageModels)语言是人类交流思想...
时间:2025-04-26 23:36栏目:综合其他
大模型原理、技术与应用从GPT到DeepSeek车万翔哈工大计算学部人工智能学院社会计算与交互机器人研究中心(HIT-SCIR)2025年2月28日为什么是语言?大模型又称大语言模型(LargelanguageModels)语言是人类交流思想...
时间:2025-04-08 11:00栏目:综合其他
天津大学自然语言处理实验室TheNaturallanguageProcessingLaboratoryatTianjinUniversity深度解读DeepSeek:部署、使用、安全石玲吴俊茹金任任杨磊熊德意TJUNLP天津大学https://tjunlp-lab.github.io伏羲传语报告...
时间:2025-03-08 15:57栏目:综合其他
天津大学自然语言处理实验室TheNaturallanguageProcessingLaboratoryatTianjinUniversity深度解读DeepSeek:原理与效应熊德意天津大学dyxiong@tju.edu.cnhttps://dyxiong.github.iohttps://tjunlp-lab.github.io...
时间:2025-02-21 22:38栏目:综合其他
天津大学自然语言处理实验室TheNaturallanguageProcessingLaboratoryatTianjinUniversity深度解读DeepSeek:原理与效应熊德意天津大学dyxiong@tju.edu.cnhttps://dyxiong.github.iohttps://tjunlp-lab.github.io...
时间:2025-02-20 21:50栏目:综合其他
DeepSeek-V3TechnicalReportDeepSeek-AIresearch@deepseek.comAbstractWepresentDeepSeek-V3,astrongMixture-of-Experts(MoE)languagemodelwith671Btotalparameterswith37Bactivatedforeachtoken.Toachieveeffici...
时间:2025-02-15 00:03栏目:综合其他
天津大学自然语言处理实验室TheNaturallanguageProcessingLaboratoryatTianjinUniversity深度解读DeepSeek:原理与效应熊德意天津大学dyxiong@tju.edu.cnhttps://dyxiong.github.iohttps://tjunlp-lab.github.io...
时间:2025-02-14 17:54栏目:综合其他
PromptGenerate生成式大模型安全评估白皮书LargelanguageModel大模型安全白皮书参与人名单前言联合编写自2022年11月以来,以ChatGPT为代表的生成式大模型持续引发全球广泛关注。作为新一轮人工智能技术革命的代表...
时间:2025-01-06 17:52栏目:综合其他
PromptGenerate生成式大模型安全评估白皮书LargelanguageModel大模型安全白皮书参与人名单前言联合编写自2022年11月以来,以ChatGPT为代表的生成式大模型持续引发全球广泛关注。作为新一轮人工智能技术革命的代表...
时间:2025-01-06 10:15栏目:综合其他